La quarta rivoluzione by Gino Roncaglia

La quarta rivoluzione by Gino Roncaglia

autore:Gino Roncaglia [Roncaglia, Gino]
La lingua: ita
Format: epub
ISBN: 9788842092995
editore: Gius. Laterza & Figli Spa
pubblicato: 2010-07-14T16:00:00+00:00


* * *

134 Un riferimento introduttivo al riguardo è il già citato, ottimo lavoro a cura di Fabio Ciotti: Fabio Ciotti (a cura di), Il manuale TEI Lite: introduzione alla codifica elettronica dei testi letterari, Edizioni Sylvestre Bonnard, Milano 2005.

2. Se il testo è nudo...

Come ricorderete, il primo formato in assoluto a essere stato usato per la realizzazione di libri elettronici è il formato .txt. È la scelta che abbiamo visto alla base della biblioteca digitale del progetto Gutenberg, e per l’assoluta portabilità del formato – che può essere letto sostanzialmente da tutti i dispositivi e in ogni ambiente informatico – questa scelta rimane ancora abbastanza popolare.

In un file di questo tipo l’unico fenomeno testuale considerato è la successione dei caratteri. Come sapete, il computer lavora ‘macinando’ bit, rappresentati attraverso lunghe successioni di ‘0’ e ‘1’. In questo caso, dunque, ogni singolo carattere è codificato da un gruppo di bit, e (con pochissime eccezioni, come l’andata a capo, rappresentate attraverso caratteri speciali o ‘di controllo’) non viene codificato nient’altro che non sia parte della successione dei caratteri del testo.

Per essere precisi, quando parliamo di questi file – detti ‘di solo testo’ – dobbiamo però fare anche riferimento alla tabella di codifica dei caratteri utilizzata. Ma... cos’è una tabella di codifica dei caratteri?

Nessun timore, non si tratta di un concetto troppo complicato135. Abbiamo detto che, perché il computer possa utilizzarli, ogni carattere è fatto corrispondere a una particolare combinazione di bit: in sostanza, a una particolare combinazione di ‘0’ e ‘1’. Questo presuppone l’accordo su una tabella di corrispondenza ‘standard’ fra caratteri da un lato e numeri binari (formati solo dalle cifre ‘0’ e ‘1’) dall’altro. In questo modo, una stessa successione di bit sarà interpretata sempre come lo stesso carattere (o come la stessa successione di caratteri), indipendentemente dal computer utilizzato.

Come costruire questa tabella? Dovremo ricordarci di includere fra i caratteri da codificare tutti quelli che vogliamo effettivamente differenziare in un testo scritto: se vogliamo poter distinguere fra lettere maiuscole e minuscole dovremo dunque inserirvi l’intero alfabeto sia maiuscolo che minuscolo, se vogliamo poter inserire nei nostri testi anche dei numeri decimali e date dovremo inserire le dieci cifre (0, 1, 2, 3, 4, 5, 6, 7, 8, 9), se vogliamo poter utilizzare segni di interpunzione (punto, virgola, punto e virgola...) dovremo inserire i caratteri corrispondenti, e così via... senza dimenticare naturalmente di includere lo spazio per separare una parola dall’altra!

Per molto tempo, la tabella di riferimento è stata quella corrispondente alla cosiddetta codifica ASCII (American Standard Code for Information Interchange; attenzione: si scrive ASCII ma si legge con la ‘c’ dura: ‘aski’). La codifica ASCII originaria (detta anche ‘ASCII stretto’: quella che abbiamo visto essere la codifica scelta da Michael Hart, l’ideatore del progetto Gutenberg) faceva corrispondere a ogni carattere una sequenza di 7 bit, e permetteva quindi di distinguere 128 caratteri: 2 elevato alla settima. La trovate riportata nella tabella seguente, con i numeri binari convertiti, per comodità, nei corrispondenti numeri decimali e con l’omissione dei primi simboli,



scaricare



Disconoscimento:
Questo sito non memorizza alcun file sul suo server. Abbiamo solo indice e link                                                  contenuto fornito da altri siti. Contatta i fornitori di contenuti per rimuovere eventuali contenuti di copyright e inviaci un'email. Cancelleremo immediatamente i collegamenti o il contenuto pertinenti.